Định nghĩa Chuẩn mực Vàng: MSE
Để đo lường mức độ sai lệch giữa dự đoán $T$ của chúng ta và thực tế $\psi(\theta)$, chúng ta định nghĩa Sai số Bình phương Trung bình (Định nghĩa 6.3.1):
$$MSE_\theta(T) = E_\theta((T - \psi(\theta))^2)$$
Đây là khoảng cách bình phương trung bình giữa ước lượng của chúng ta và mục tiêu. Một ước lượng hoàn hảo sẽ có MSE bằng không, nhưng trong thế giới nhiễu ngẫu nhiên, chúng ta cố gắng tối thiểu hóa nó.
Định lý 8.1.1: Kiến trúc của Sai số
Tại sao một ước lượng lại thất bại? Định lý 8.1.1 cung cấp bản thiết kế. Nếu $T$ có phương sai bậc hai hữu hạn, sai số so với hằng số $c$ bất kỳ được cho bởi:
Công thức này tiết lộ rằng tổng sai số bình phương được tối thiểu hóa chỉ khi khi chúng ta chọn $c = E(T)$. Trong bối cảnh suy luận, chúng ta đặt $c = \psi(\theta)$, dẫn đến phân tích nổi tiếng:
MSE = Phương sai + Sai lệch hệ thống$^2$
Sự đánh đổi giữa Độ chính xác và Độ tin cậy
Hãy tưởng tượng hai chiếc cân trong phòng kiểm soát chất lượng:
- Người thợ săn Chính xác: Nó luôn cho cùng một trọng lượng mỗi lần (phương sai thấp), nhưng bị sai lệch 2 gam (sai lệch hệ thống cao).
- Người thầy Khôn ngoan Bất ổn: Nó đúng về trung bình (sai lệch hệ thống bằng 0), nhưng dao động mạnh giữa các lần đo (phương sai cao).
Định lý 8.1.1 cho phép chúng ta tính toán chính xác chiếc cân nào cung cấp sai số tổng thể thấp hơn. Thường thì chúng ta sẵn sàng chấp nhận một lượng sai lệch hệ thống nhỏ nếu điều đó làm giảm đáng kể nhiễu (phương sai).
Ví dụ 8.1.1: Tính đầy đủ và Thông tin
Tối ưu liên quan đến Thông tin. Hãy xem xét không gian mẫu $S = \{1, 2, 3, 4\}$. Nếu các kết quả 2, 3 và 4 có khả năng xảy ra như nhau dưới mọi tham số khả dĩ, chúng mang theo xác suất giống nhau. Chúng ta có thể định nghĩa một thống kê đầy đủ $U$ nhóm các kết quả này lại với nhau mà không mất đi khả năng suy luận tối ưu. Như minh họa trong mô phỏng, nếu $L(\cdot|2) = L(\cdot|3) = L(\cdot|4)$, một ước lượng tối ưu coi chúng như một sự kiện thông tin duy nhất.